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INTERPRETACJA PRZYCZYNOWA 
WYNIKÓW ANALIZY STATYSTYCZNEJ 


Artykuł prof. Brzezińskiego jest ważnym głosem w dyskusji na temat roli 
i praktyki stosowania statystyki w badaniach psychologicznych. W moim ko- 
mentarzu rozwijam wątek interpretacji przyczynowej wyników analizy staty- 
stycznej (AS), który jest tylko śladowo obecny w wiodącym artykule. 

Zaprezentowana analiza terminu „istotności” oraz przyczynowej interpretacji 
wyników AS wymaga szczegółowego wyjaśnienia i pogłębienia. Prof. Brzeziń- 
ski operacjonalizuje istotność zmiennej niezależnej (np. w analizie regresji) jako 
część wariancji w zmiennej zależnej tłumaczoną wariancją w zmiennej niezależ- 
nej. Tak zdefiniowana „istotność” jest jednocześnie utożsamiana z efektem przy- 
czynowym zmiennej niezależnej. Ponieważ analiza przyczynowa jest centralnym 
elementem wyjaśnienia naukowego (np. Cartwright, 2002), poświęcam temu 
wątkowi mój komentarz. 

Przed rozpoczęciem rozważań nad problemem interpretacji przyczynowej 
wyników AS musimy określić perspektywę filozoficzną, z której wyniki badań 
są interpretowane. Z punktu widzenia naukowego instrumentalizmu (Stanford, 
2006) analiza przyczynowa zjawisk (i wyników badań) psychologicznych nie 
jest celem badania empirycznego. Wyniki badań nie odnoszą się ani do prawdy, 
ani do rzeczywistości psychologicznej, a jedynie do postępu naukowego i aku- 
mulacji wiedzy. W tym aspekcie analiza przyczynowa wyników AS hamuje po- 
stęp nauki przez nakładanie zbędnych ograniczeń na wyjaśnienie naukowe. Je- 
dynymi kryteriami oceny jakości badania empirycznego jest osiągnięcie dużego 
efektu (np. mierzonego współczynnikiem R”) oraz replikacja otrzymanych wy- 
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ników badań w przyszłości. W konsekwencji ani forma planu badawczego, ani 
szczegóły modelu statystycznego nie są istotne, gdyż wyjaśnienie naukowe jest 
synonimiczne z predykcją. 

Złoty okres instrumentalizmu, rozwijanego przez empirystów logicznych 
Koła Wiedeńskiego, jest dzisiaj przeszłością zarówno w głównym nurcie filozo- 
fii nauki (Cartwright, 2002), jak i psychologii (Haig, 2005). Instrumentalizm jest 
zastąpiony realizmem naukowym, w którym prawdziwość lub izomorfizm teorii 
ze zjawiskiem psychologicznym jest głównym kryterium oceny teorii. Z tej per- 
spektywy zastosowany model statystyczny formalizuje kluczowe relacje postu- 
lowane przez teorię zjawiska psychologicznego, a AS odnosi się do analizy mo- 
delu tego zjawiska. W ten sposób analiza przyczynowa efektów postulowanych 
w modelu staje w centrum uwagi wyjaśnienia naukowego. Parametry modelu 
są parametrami przyczynowymi, określającymi siłę oddziaływania lub wpływ 
jednej zmiennej psychologicznej na inną zmienną. W konsekwencji zastosowany 
plan badawczy oraz wykorzystany model statystyczny nabierają krytycznego 
znaczenia. 

Chociaż analiza przyczynowa jest znacznie ułatwiona w przypadku praw- 
dziwego eksperymentu, to zdecydowana większość badań empirycznych w psy- 
chologii polega na pasywnej obserwacji pozbawionej krytycznego elementu ran- 
domizacji. Stan ten jest powodowany zarówno czynnikami praktycznymi, jak 
i etycznymi. Prawdziwy eksperyment służy jednak jako „złoty standard” w inter- 
pretacji przyczynowej wyników pasywnej obserwacji. 

W dalszej części mojego komentarza posłużę się przykładem modelu regre- 
sji. W tym ujęciu zmienna niezależna, która pozostaje pod kontrolą badacza, jest 
określana zmienną ustaloną. Osoby badane są przypisane do poziomów zmiennej 
ustalonej za pomocą procesu losowego (randomizacji). Zmienna niezależna, 
która nie pozostaje pod kontrolą badacza, jest określana zmienną losową. Osoby 
badane są przypisane do poziomów zmiennej losowej za pomocą nieznanego, 
lecz deterministycznego procesu selekcji. Dla uproszczenia prezentacji wszystkie 
zmienne są wyrażone w formie odchyleń od średnich wartości. 

W swoim przewodnim artykule prof. Brzeziński dzieli zmienne niezależne 
na kontrolowane i niekontrolowane. Zmienne kontrolowane są źródłem wariancji 
wyjaśnionej, a zmienne niekontrolowane są źródłem wariancji niewyjaśnionej, 
zwanej także wariancją resztową lub wariancją błędu. Jako kontrast proponuję 
podział zmiennych niezależnych na mierzone i niemierzone. Zmienne mierzone 
dzielą się na, scharakteryzowane w poprzednim paragrafie, zmienne ustalone 
i zmienne losowe. Zmienne mierzone to te, które są brane pod uwagę w analizo- 
wanym modelu statystycznym. Są one źródłem wariancji wyjaśnionej. Zmienne 
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niemierzone nie są składnikiem modelu i ich efekt jest źródłem wariancji nie- 
wyjaśnionej lub wariancji resztowej. 

Aby wyjaśnić złożoność zagadnienia interpretacji przyczynowej, rozważmy 
następujący model regresji prostej: 


Y=P,„X +E (0.1) 


Ponieważ osoby badane są przypisane do poziomów zmiennej X* za pomocą 
randomizacji, zmienna ta jest ustalona. W konsekwencji współczynnik regresji 
b. ma interpretację przyczynową jako efekt bezpośredni zmiennej X* na 
zmienną Y. Zauważmy, że powyższa interpretacja przyczynowa parametru B 
jest możliwa, ponieważ ustalenie predykatora X* urealistycznia spełnienie ko- 
niecznego warunku przyczynowego E(X'e*) = 0 albo zera kowariancji między 
zmienną niezależną a resztami regresji. W przeciwieństwie do tez przedstawio- 
nych w wiodącym artykule, założenie istotności predykatora lub R. >0 jest 
jedynie warunkiem koniecznym, ale niewystarczającym dla interpretacji 
przyczynowej efektu zmiennej X” na Y. 

Teraz rozważmy następujący model regresji: 


Y=P,„X+e (0.2) 


w którym X jest zmienną losową. W konsekwencji musimy przyjąć, że 
zmienna wyjaśniająca jest skorelowana z przyczynami nieujętymi w modelu, 
E(Xe) + 0. Współczynnik Ba nie może być uważany za efekt przyczynowy, 
ponieważ Pa + Pa chyba że E(Xe) = 0. Problem wnioskowania przyczyno- 
wego polega na tym, że założenie odnośnie do braku korelacji między predyka- 
torem i resztami regresji nie jest założeniem statystycznym. Nie może być ono 
zweryfikowane w danych użytych do oszacowania danego modelu regresji. Po- 
nadto w zależności od kierunku i wielkości tej korelacji oraz korelacji między Y 
i X prawdziwy efekt przyczynowy może być zerowy, mniejszy od zera lub więk- 
szy od zera. 

Niektórzy badacze wierzą, że rozwinięcie modelu w równaniu (0.2) poprzez 
dodanie zmiennej (lub zmiennych) kontrolnej Z 


Y=B,.X +yZ+e (0.3) 
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przybliży oszacowaną wartość współczynnika Ø, do prawdziwej wartości 
efektu przyczynowego. Niestety tak nie jest, chociaż rozwinięcie listy predykto- 
rów o Z zazwyczaj zwiększy moc wyjaśniającą modelu, Rez BR > Zwróćmy 
jednak uwagę, że lista założeń przyczynowych jest teraz dłuższa: E(Xe) = 0 
i E(Ze) = 0. Innymi słowy, założenia przyczynowe określają, że każdy predyk- 
tor zawarty w modelu nie jest skorelowany z resztami regresji. 

Celem tego komentarza jest zwrócenie uwagi na złożoność warunków po- 
zwalających na wnioskowanie przyczynowe z pasywnych obserwacji. Określenie 
szczegółowych kryteriów pozwalających na interpretację przyczynową oszaco- 
wań parametrów złożonych modeli statystycznych jest obecnie obszarem szyb- 
kiego i fascynującego rozwoju. Obecnie najbardziej obiecującą strategią jest teo- 
ria kierunkowych niecyklicznych grafów (directed acyclical graphs) rozwijana 
przez Pearla (2000, 2002, 2010). 
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